دسته بندی صفحات وب برای پالایش
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده ریاضی
- author شیما رشیدی
- adviser محمد رضا فیضی درخشی محمد علی بالافر
- Number of pages: First 15 pages
- publication year 1392
abstract
مسئل? حفاظت از اقشار آسیب پذیر جامعه در مقابل موارد ناهنجار در صفحات وب، موجب احساس نیاز به پالایش صفحات وب شده است. یکی از جنبه های پالایش صفحات وب که امروزه بیش از پیش مورد توجه قرار گرفته است، طبقه بندی صفحات بر اساس میزان خشونت آمیز بودن آن ها است. طبقه بندی در واقع نسبت دادن یک صفحه به یک یا چند موضوع از پیش تعیین شده با استفاده از الگوهای آموزش داده شده می باشد. سیستم با استفاده از یک سری صفحات آموزشی که موضوع آن ها از قبل تعیین شده است، آموزش داده می شود تا بتواند اسناد جدید را به صورت صحیح طبقه بندی نماید. روش های مختلفی برای این کار وجود دارد که اغلب روش های آماری یا هوش مصنوعی می باشند. در این پایان نامه رویکرد همنشینی کلمات برای طبقه بندی صفحات وب فارسی پیشنهاد شده است. در واقع با استخراج میزان همنشینی کلمات خشونت آمیز با هم و با کلمات تعدیل کنند? خشونت ، متون فارسی به دو دسته خشونت آمیز و غیرخشونت آمیز طبقه بندی می شوند. به دلیل عدم وجود مجموع? داده استاندارد، صفحات وب به صورت دستی جمع آوری شده است. در روش ارائه شده، در فاز آموزش از 70 داد? آموزشی برچسب دار استفاده شده است. در این فاز با استفاده از داده ها، میزان همنشینی کلمات خشونت آمیز با هم و با کلمات تعدیل کنند? خشونت محاسبه شده و ماشین آماد? طبقه بندی صفحات جدید می شود. برای سنجش کیفیت کار نیز از 120 صفح? وب استفاده شده است و در نهایت الگوریتم طبقه بندی کننده توانسته است به دقت 175/97% دست پیدا کند.
similar resources
ارائه روشی ترکیبی برای دسته بندی موضوعی صفحات وب به صورت خودکار
اهمیت دسته بندی موضوعی صفحات وب باعث شده با پیدایش اولین سایت های اینترنتی شرکت های بزرگی مانند یاهو و aol به فکر ارائه سرویس های فهرست وب که وب سایت های مختلف را با کمک نیروی انسانی بر اساس موضوع دسته بندی می کند بیفتند. با افزایش روز افزون تعداد صفحات وب و عدم امکان دسته بندی صفحات وب به صورت دستی و همچنین پیدایش کاربرد های دیگری برای دسته بندی خودکار صفحات وب از قبیل فیلترینگ هوشمند و ایجاد ...
دسته بندی صفحات وب با استفاده از الگوریتم های یادگئری ماشین و هوش محاسباتی
امروزه صفحات گسترده وب به بزرگ ترین منبع اطلاعات برای انسان تبدیل شده است. با افزایش تعداد کاربران وب و همچنین وب سایت ها، نیاز به دسته بندی صفحات وب روز به روز بیش تر احساس می شود. در این پایان نامه، ابتدا مجموعه داده مناسبی از چهار گروه از صفحات وب استخراج شده است. در ادامه از اطلاعات موجود در متن، ساختارو آدرس صفحات وب استفاده شده است. پس از پیش پردازش اطلاعات ورودی و حذف کلمات غیر مرتبط موج...
15 صفحه اولاستفاده از روش دسته بندی طیفی سلسله مراتبی در شبکه های قدرت تحت وب
سیستم انتقال برق را می توان با شبکهای نشان داد که دارای گره و اتصالات می باشد که نشان دهنده شین ها و خطوط انتقال الکتریکی هستند. به هر خط می توان مقدار داد که نشان دهنده برخی از ویژگی های الکتریکی خط مثل ادمیتانس خط یا توان عبوری متوسط در زمان مشخص می باشد. از روش دستهبندی طیفی سلسله مراتبی برای آشکار سازی ساختار اتصالات داخلی یک شبکه استفاده می کنیم. دستهبندی طیفی از مقادیر و بردار های ویژه...
full textرسانه، ابزاری برای دسته بندی نسلها در ایران
عوامل متفاوتی ابژه های یک نسل را ساخته و می توان از چنین شاخص هایی برای بررسی تغییرات و ایجاد تمایز در بین نسلها بهره برد. مطالعات انجام شده در حوزه نسلها را می توان به دو دسته کلان تقسیم نمود. مطالعاتی که به ترسیم ویژگی های یک نسل و یا نسلهای مختلف پرداخته اند و در پی تفسیر علل تفاوت کنش های اجتماعی در نسلهای مختلف بوده اند و دسته دیگر از بررسی ها، به مطالعه وضعیت روابط بین نسلها همت گمارده و ...
full textتکوین معیارهای زیباییشناسی صفحات وب ایران
چکیده بررسی زیبایی در محیط تعاملی وب بهمعنای توجه به مخاطب بهمثابهی دریافتکنندهای منفعل نیست بلکه به معنی نیاز به روشی برخط است تا بتوان مخاطب را در فرایند طراحی وارد نمود. هدف از پژوهش، پیشنهاد روشی برای اخذ بازخورد مخاطب و تحلیل نتایج بهمنظور دستیافتن به معیارهای زیباییشناسی مخاطبمحور است. روش تحقیق، توصیفی-تحلیلی، همراه مطالعات کتابخانهای، پژوهش میدانی و مصاحبه است. جهت تحلیل داده...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده ریاضی
Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023